Sara

Trabajo enviado como doc y metido en la Wiki
ESTUDIO SOBRE LA PROTEÍNA ARABINOSILTRANSFERASA AftA DE Rhodococcus
Sara Tagarro Jáñez
Trabajo poco elaborado, con tres referencias puestas al final pero sin mencionarlas en el texto. El análisis de Artemis no correcto.
La proteína empieza en MILG.... o sea que la mayoría de las construcciones no son correctasLa proteína empieza en MILG.... o sea que la mayoría de las construcciones no son correctas
1. Rhodococcus
El nombre del género Rhodococcus fue propuesto Goodfellow y Alderson en un estudio de clasificación por taxonomía numérica. Estas bacterias exhiben un amplio rango de actividades metabólicas. Algunas de ellas tienen la habilidad de degradar una variedad de compuestos orgánicos, incluyendo xenobióticos como bifenilos policlorinados, mientras otras son capaces de degradar numerosos hidrocarburos alifáticos, alifáticos ramificados y aromáticos. Están presentes en suelos patagónicos contaminados con hidrocarburos provenientes del petróleo, y están sometidos a condiciones de estrés térmico y osmótico. Se sabe que cumplen un rol importante en la biorremediación.

Taxonómicamente se clasifica de la siguiente manera:

Bacteria
· Actinobacteria
Actinobacteria (clase)
Actinobacteridae
Actinomycetales
Corynebacterineae
Nocardiaceae
Rhodococcus


Es una bacteria Gram positiva, inmóvil y no esporulada.


Dentro de la secuencia dada de 17000 nucleótidos, obtenemos mediante el programa informático Artemis la siguiente distribución de marcos de lectura que pueden ser posibles codificadores de proteínas:

external image C:%5CDOCUME%7E1%5CJOSANT%7E1%5CCONFIG%7E1%5CTemp%5Cmsohtml1%5C01%5Cclip_image002.jpg



Entre estas, he seleccionado la proteína Arabinosiltransferasa para llevar a cabo un estudio más exhaustivo.


ARABINOSIL TRANSFERASA
Esta proteína, de carácter enzimático, tiene el ORF situado entre las bases 7404 y 9338 de la secuencia dada. La función que puede desempeñar en la bacteria es la síntesis de componentes de la pared celular. Referencia o explicación. Está Ud. segura?

La secuencia en bases de la proteína es la siguiente:

GCTCGGGCCGTGTCGCAATCAGGTGCAGCCCCCCTCGCAACGTCGCGAGTCGCCCCTGCC
10 20 30 40 50 60
CGACTGGCCGGTGGAACCGCTGTCGAGATGATCCTCGGGGCCTTCGTGGCCGCGATCGTC
70 80 90 100 110 120
GCCGCGGTGGGACTGTTCGCCTTCGGTCGGGTGTCGTGGCCGGCGTTTCCGTCGTCGAAC
130 140 150 160 170 180
GTCACACAGGCCGTCACGACGGTGGGGCAGGTCGTCACGATCGCCGTTCTCGCGCTGTGT
190 200 210 220 230 240
GTCGCCCTCTTCCGCGCCCGACGGTGGACCCGCGCGGCGACCCTACTGTCGTGGGCCGGG
250 260 270 280 290 300
CTGTCCGGCTTCGTGACGGTGACGCTCGGCATGCCGCTGAGCGCCACGAAGCTGTACCTG
310 320 330 340 350 360
CACGGCGTTTCGGTCGACCAGGAGTTCCGCACCGAATACCTCACGCGCCTCACCGATTCC
370 380 390 400 410 420
GCAGCGCTGCACGACATGACGTACGCGGATCTGCCGCCGTACTACCCGGCCGGGTGGTTC
430 440 450 460 470 480
TGGATCGGCGGCCGTGTCGCGAATCTGCTCGGCATGGACGGCTGGGAGACCTTCAAGCCG
490 500 510 520 530 540
TACGCGATCGGTTCGATCGCCGTAGCCGCCGTCGTCGCGCTGGTGTTGTGGACCAAGCTG
550 560 570 580 590 600
ATTCGCACCGACCGCGCGATCGTGGTCGCGCTGGCAACCGCCGCGCTGACAGTCGCGTAC
610 620 630 640 650 660
GCCTCGTCCGAGCCGTACGGCGCCGTGATCGCCGTCCTGATTCCACCGGTCCTCGTGCTG
670 680 690 700 710 720
GCGTGGGGCGGACTGCACCGTCCGGATCGGACCGGCCGCGGAGGATGGGGCGCCGTTGTC
730 740 750 760 770 780
GGCACCGGCATCTTCCTCGGTGTCGCCGCCGCGTTCTACACGCTGTACCTCGGACTCTCG
790 800 810 820 830 840
GCATTCGCCATCACGCTCATGGCCCTGGTCGCGGCGGGTCTCGCCGTCCGGGCGCAAGGC
850 860 870 880 890 900
TCGTGGCGCGGAGCGGTCGCCCCCTTGGTTCGGTTGGCCGTCATCGCCGCGATCGCGATC
910 920 930 940 950 960
GCGATCGCGCTTACCGTTTGGCTGCCCTACCTGCTCGAGGCGCTGCACGGTGTGCCCGCC
970 980 990 1000 1010 1020
GGTAGCGGCACCGCCACGCACTACCTCCCCGACGCCGGTGCGCGCCTGCCGCTTCCGATG
1030 1040 1050 1060 1070 1080
CTCCAGCTCTCGCTCTCCGGGGCGCTGTGTCTGCTCGGCACGATCTGGCTGGTATTCCGG
1090 1100 1110 1120 1130 1140
GTGACCTCGTCACGTCGAGCCCAAGCGCTCGGCATCGGCGTGGTGGCGATCTACCTGTGG
1150 1160 1170 1180 1190 1200
TCGCTGATGTCGATGGCGTTCACCGCGGTGGGTGGCACGTTGCTGTCCTTCCGCCTCGAA
1210 1220 1230 1240 1250 1260
CCGGTGCTCATCCTGCTGCTCGGGGCCGCCGGCGTGTTCGGTTTCTTCGACTTCGCGCGC
1270 1280 1290 1300 1310 1320
TGGCTCGTCCTGGCGACAAGCGATAATCCACGAGTGAAGGCGTCCGTCGTCGTGATCGGA
1330 1340 1350 1360 1370 1380
CTCGTGGGTCTGATCGCCTTCGCGCAGAACATCCCCCAGGTGCTGTCGAACGACATCACC
1390 1400 1410 1420 1430 1440
GTCGCGTACACCGACACGGACGGCGACGGTGCCCGCGGCGACCAGCGCCCGCCCGGCGCG
1450 1460 1470 1480 1490 1500
GCCTCCTACTACGGCGACATCGACCGGACGATCCTCGAGCGGCGCCCCGGCGAGCGCCAC
1510 1520 1530 1540 1550 1560
GACACGGTGGTGCTCACGTCGGACACCAGCTTCCTCAGCTTCTACCCGTACTACGGATTC
1570 1580 1590 1600 1610 1620
CAGGCGCTGACGTCGCACTACGCGAATCCTTTGGCGCAGTTCCGCGAGCGCTCGGAGGCG
1630 1640 1650 1660 1670 1680
ATCGAGAGCTGGACGGAGTTCGAGACGCCGGACGAGCTCGTCGCTGCGCTCGACGAATTG
1690 1700 1710 1720 1730 1740
CCCTGGCGCGCACCGGACGTGTTCGTCTTCCGCAAGAGCGCCGACGGCTACACCCTGCGC
1750 1760 1770 1780 1790 1800
CTGGCCGAGGACGTCTACCCGAACAATCCGAACGTCCGCCGCTACAGCGTCTCCTTCCCG
1810 1820 1830 1840 1850 1860
AAATCGCTGTTCGACGACCCGCGCTTCACCGTCAACGAGGTGGGACCGTTCGCGATCGTG
1870 1880 1890 1900 1910 1920
ACGCGCGTCGGCTGA
1930

Y la secuencia en aminoácidos quedaría de la siguiente forma:
La proteína empieza en MILG.... o sea que la mayoría de las construcciones no son correctas
ARAVSQSGAAPLATSRVAPARLAGGTAVEMILGAFVAAIVAAVGLFAFGRVSWPAFPSSN
10 20 30 40 50 60
VTQAVTTVGQVVTIAVLALCVALFRARRWTRAATLLSWAGLSGFVTVTLGMPLSATKLYL
70 80 90 100 110 120
HGVSVDQEFRTEYLTRLTDSAALHDMTYADLPPYYPAGWFWIGGRVANLLGMDGWETFKP
130 140 150 160 170 180
YAIGSIAVAAVVALVLWTKLIRTDRAIVVALATAALTVAYASSEPYGAVIAVLIPPVLVL
190 200 210 220 230 240
AWGGLHRPDRTGRGGWGAVVGTGIFLGVAAAFYTLYLGLSAFAITLMALVAAGLAVRAQG
250 260 270 280 290 300
SWRGAVAPLVRLAVIAAIAIAIALTVWLPYLLEALHGVPAGSGTATHYLPDAGARLPLPM
310 320 330 340 350 360
LQLSLSGALCLLGTIWLVFRVTSSRRAQALGIGVVAIYLWSLMSMAFTAVGGTLLSFRLE
370 380 390 400 410 420
PVLILLLGAAGVFGFFDFARWLVLATSDNPRVKASVVVIGLVGLIAFAQNIPQVLSNDIT
430 440 450 460 470 480
VAYTDTDGDGARGDQRPPGAASYYGDIDRTILERRPGERHDTVVLTSDTSFLSFYPYYGF
490 500 510 520 530 540
QALTSHYANPLAQFRERSEAIESWTEFETPDELVAALDELPWRAPDVFVFRKSADGYTLR
550 560 570 580 590 600
LAEDVYPNNPNVRRYSVSFPKSLFDDPRFTVNEVGPFAIVTRVG
610 620 630 640

  • Primers para amplificación por PCR

Para amplificar la proteína escogida por PCR podemos escoger el siguiente los siguientes primers izquierdo y derecho:

<span style="font-family: Arial;">OLIGO                     [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_START|start]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_LEN| len]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_TM|     tm]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_GC|    gc%]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_ANY|  any]]  [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_REPEAT|  3']] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_OLIGO_SEQ|seq]]  </span>
<span style="font-family: Arial;">LEFT PRIMER       1190   20   59.86   55.00  3.00  0.00 TCTACCTGTGGTCGCTGATG </span>
RIGHT PRIMER 1362 20 60.10 50.00 4.00 3.00 CGCCTTCACTCGTGGATTAT

A parte de este, podemos utilizar como oligonucleótidos adicionales los siguientes:

<span style="font-family: Arial;">                                     [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_START|start]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_LEN| len]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_TM|     tm]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_GC|    gc%]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_ANY|  any]]  [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_REPEAT|  3']] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_OLIGO_SEQ|seq]]  </span>
<span style="font-family: Arial;"> </span>
<span style="font-family: Arial;"> 1 LEFT PRIMER       1584   20   59.75   55.00  4.00  1.00 CACCAGCTTCCTCAGCTTCT </span>
<span style="font-family: Arial;">   RIGHT PRIMER      1833   20   59.93   50.00  3.00  0.00 GTTCGGATTGTTCGGGTAGA </span>
<span style="font-family: Arial;">   PRODUCT SIZE: 250, PAIR ANY COMPL: 3.00, PAIR 3' COMPL: 3.00 </span>
<span style="font-family: Arial;"> </span>
<span style="font-family: Arial;"> 2 LEFT PRIMER       1584   20   59.75   55.00  4.00  1.00 CACCAGCTTCCTCAGCTTCT </span>
<span style="font-family: Arial;">   RIGHT PRIMER      1832   20   59.93   50.00  3.00  2.00 TTCGGATTGTTCGGGTAGAC </span>
<span style="font-family: Arial;">   PRODUCT SIZE: 249, PAIR ANY COMPL: 3.00, PAIR 3' COMPL: 2.00 </span>
<span style="font-family: Arial;"> </span>
<span style="font-family: Arial;"> 3 LEFT PRIMER       1192   20   59.71   55.00  3.00  2.00 TACCTGTGGTCGCTGATGTC </span>
<span style="font-family: Arial;">   RIGHT PRIMER      1362   20   60.10   50.00  4.00  3.00 CGCCTTCACTCGTGGATTAT </span>
<span style="font-family: Arial;">   PRODUCT SIZE: 171, PAIR ANY COMPL: 3.00, PAIR 3' COMPL: 1.00 </span>
<span style="font-family: Arial;"> </span>
<span style="font-family: Arial;"> 4 LEFT PRIMER       1583   20   59.60   55.00  4.00  0.00 ACACCAGCTTCCTCAGCTTC </span>
<span style="font-family: Arial;">   RIGHT PRIMER      1832   20   59.93   50.00  3.00  2.00 TTCGGATTGTTCGGGTAGAC </span>
<span style="font-family: Arial;">   PRODUCT SIZE: 250, PAIR ANY COMPL: 3.00, PAIR 3' COMPL: 1.00 </span>
<span style="font-family: Arial;"> </span>
<span style="font-family: Arial;"> </span>
<span style="font-family: Symbol;">·<span style="font-family: "Times New Roman"; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal; -x-system-font: none;">         </span></span>**<span style="font-family: Arial;">Diseño de primers para amplificación de segmentos internos. </span>**
<span style="font-family: Arial;">               Para amplificar fragmentos internos de la secuencia podemos utilizar los siguientes primers: </span>
<span style="font-family: Arial;"> </span>
OLIGO            [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_START|start]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_LEN| len]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_TM|     tm]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_GC|    gc%]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_ANY|  any]]  [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_REPEAT|  3']] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_OLIGO_SEQ|seq]]
INTERNAL_OLIGO    1814   20   59.93   50.00  3.00  0.00 TCTACCCGAACAATCCGAAC
SEQUENCE SIZE: 1935
INCLUDED REGION SIZE: 1935
 
[[code]]
ADDITIONAL OLIGOS
[[code]]
                    [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_START|start]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_LEN| len]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_TM|     tm]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_GC|    gc%]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_ANY|  any]]  [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_REPEAT|  3']] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_OLIGO_SEQ|seq]]
 1 INTERNAL_OLIGO    1813   20   59.93   50.00  3.00  2.00 GTCTACCCGAACAATCCGAA
 2 INTERNAL_OLIGO    1343   20   60.10   50.00  4.00  2.00 ATAATCCACGAGTGAAGGCG
 3 INTERNAL_OLIGO    1807   20   60.11   55.00  6.00  0.00 GAGGACGTCTACCCGAACAA
 4 INTERNAL_OLIGO    1190   20   59.86   55.00  3.00  0.00 TCTACCTGTGGTCGCTGATG
 
[[code]]

[[code]]
<span style="font-family: Arial;"> </span>
<span style="font-family: Symbol;">·<span style="font-family: "Times New Roman"; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal; -x-system-font: none;">         </span></span>**<span style="font-family: Arial;">Análisis de los aminoácidos de la proteína. </span>**
<span style="font-family: Arial;">               La proteína está compuesta por 1935 aminoácidos, y tiene un peso molecular de 161701.4. </span>
<span style="font-family: Arial;">               Los aminoácidos que la componen aparecen en los siguientes porcentajes: </span>
Arg (R) 0 0.0%
Asn (N) 0 0.0%
Asp (D) 0 0.0%
Cys (C) 691 35.7%
Gln (Q) 0 0.0%
Glu (E) 0 0.0%
Gly (G) 635 32.8%
His (H) 0 0.0%
Ile (I) 0 0.0%
Leu (L) 0 0.0%
Lys (K) 0 0.0%
Met (M) 0 0.0%
Phe (F) 0 0.0%
Pro (P) 0 0.0%
Ser (S) 0 0.0%
Thr (T) 363 18.8%
Trp (W) 0 0.0%
Tyr (Y) 0 0.0%
Val (V) 0 0.0%
Pyl (O) 0 0.0%
Sec (U) 0 0.0%

La composición molecular es:
Carbon C 5533
Hydrogen H 9133
Nitrogen N 1935
Oxygen O 2299
Sulfur S 691

El índice de inestabilidad obtenido para la proteína es de 51’39, lo que hace que se le clasifique como inestable.

Para la identificación de péptidos líder se ha obtenido el siguiente resultado utilizando el programa bioinformático SignalP:
**SignalP-NN result:**
 
 
 
 
 
 
 
 
 
 
[[image:file:///C:%5CDOCUME%7E1%5CJOSANT%7E1%5CCONFIG%7E1%5CTemp%5Cmsohtml1%5C01%5Cclip_image003.gif width="640" height="336"]]

# data

>Sequence              length = 70
# Measure  Position  Value  Cutoff  signal peptide?
  max. C    21       0.197   0.52   NO
  max. Y    24       0.210   0.32   NO
  max. S    18       0.956   0.97   NO
  mean S     1-23    0.594   0.51   YES
       D     1-23    0.402   0.45   NO
# Most likely cleavage site between pos. 23 and 24: RLA-GG
**SignalP-HMM result:**
<span style="position: relative; z-index: 2; left: -36px; top: 0px; width: 640px; height: 336px;">[[image:file:///C:%5CDOCUME%7E1%5CJOSANT%7E1%5CCONFIG%7E1%5CTemp%5Cmsohtml1%5C01%5Cclip_image004.gif width="640" height="336"]]</span>
 
 
 
 
 
 
 
 
 
 
 
 
[[code]]
<span style="font-size: 10pt; line-height: 150%; font-family: "Courier New";"> </span>
<span style="font-size: 10pt; line-height: 150%; font-family: "Courier New";"># [[http://www.cbs.dtu.dk/services/SignalP/tmp/TMP090706015619.5921403/hmm-score.1|data]] </span>
<span style="font-size: 10pt; line-height: 150%; font-family: "Courier New";"> </span>
>Sequence
[[code]]
Prediction: Non-secretory protein
Signal peptide probability: 0.096
Max cleavage site probability: 0.058 between pos. 64 and 65

También se ha analizado la presencia de dominios transmembrana, mediante TMHMM, y los resultados son de una alta probabilidad de presencia de este tipo de dominios:
# Sequence Length: 644
# Sequence Number of predicted TMHs: 13
# Sequence Exp number of AAs in TMHs: 271.195
# Sequence Exp number, first 60 AAs: 22.29902
# Sequence Total prob of N-in: 0.99956
# Sequence POSSIBLE N-term signal sequence
Sequence TMHMM2.0 inside 1 26
Sequence TMHMM2.0 TMhelix 27 49
Sequence TMHMM2.0 outside 50 63
Sequence TMHMM2.0 TMhelix 64 86
Sequence TMHMM2.0 inside 87 92
Sequence TMHMM2.0 TMhelix 93 115
Sequence TMHMM2.0 outside 116 180
Sequence TMHMM2.0 TMhelix 181 198
Sequence TMHMM2.0 inside 199 204
Sequence TMHMM2.0 TMhelix 205 222
Sequence TMHMM2.0 outside 223 225
Sequence TMHMM2.0 TMhelix 226 245
Sequence TMHMM2.0 inside 246 251
Sequence TMHMM2.0 TMhelix 252 274
Sequence TMHMM2.0 outside 275 278
Sequence TMHMM2.0 TMhelix 279 296
Sequence TMHMM2.0 inside 297 308
Sequence TMHMM2.0 TMhelix 309 331
Sequence TMHMM2.0 outside 332 355
Sequence TMHMM2.0 TMhelix 356 378
Sequence TMHMM2.0 inside 379 389
Sequence TMHMM2.0 TMhelix 390 412
Sequence TMHMM2.0 outside 413 421
Sequence TMHMM2.0 TMhelix 422 444
Sequence TMHMM2.0 inside 445 455
Sequence TMHMM2.0 TMhelix 456 475
external image C:%5CDOCUME%7E1%5CJOSANT%7E1%5CCONFIG%7E1%5CTemp%5Cmsohtml1%5C01%5Cclip_image005.gif
Sequence TMHMM2.0 outside 476 644





<span style="font-family: Arial;"> </span>
 
[[code]]

[[code]]
 
<span style="font-family: Arial;"> </span>
<span style="font-family: Arial;"> </span>
<span style="font-family: Arial;"> </span>
<span style="font-family: Arial;"> </span>
<span style="font-family: Arial;"> </span>
<span style="font-family: Arial;"> </span>
<span style="font-family: Arial;">REFERENCIAS </span>
<span style="font-family: Arial;"> </span>
· Influence of extracellular polymeric substances (EPS) on deposition kinetics of bacteria. Long G, Zhu P, Shen Y, Tong M. Environ Sci Technol. 2009 Apr 1;43(7):2308-14.

· Biodegradation aspects of Polycyclic Aromatic Hydrocarbons (PAHs): A review. Haritash AK, Kaushik CP. J Hazard Mater. 2009 Apr 7.

· Synthesis of oligosaccharides as potential inhibitors of mycobacterial arabinosyltransferases. Di- and trisaccharides containing C-5 modified arabinofuranosyl residues. Cociorva OM, Lowary TL. Carbohydr Res. 2004 Mar 15;339(4):853-65.


 
[[code]]

[[code]]